智能论文笔记

State-Dependent Temperature Control for Langevin Diffusions

Xuefeng Gao , Zuo Quan Xu , Xun Yu Zhou

分类：机器学习

2020-11-15

在非凸优化的背景下，研究Langevin扩散的温度控制问题。这种问题的经典最优控制是Bang-Bang类型，这对错误过于敏感。补救措施是允许扩散探索其他温度值，从而平滑爆炸控制。我们通过一种随机轻松的控制配方来实现这一点，该配方包括温度控制的随机性并规范其熵。我们得出了一个国家相关的截断的指数分布，其可用于在HJB偏微分方程的解决方案方面采样LangeVin算法中的温度。我们对一维基线示例进行数值实验，其中HJB方程可以很容易地解决，以比较算法与三个其他可用算法的性能，以搜索全局最优。

translated by 谷歌翻译

RT-1: Robotics Transformer for Real-World Control at Scale

Anthony Brohan , Noah Brown , Justice Carbajal , Yevgen Chebotar , Joseph Dabis , Chelsea Finn , Keerthana Gopalakrishnan , Karol Hausman , Alex Herzog , Jasmine Hsu

分类：机器人 | 人工智能 | 自然语言处理 | 计算机视觉 | 机器学习

2022-12-13

By transferring knowledge from large, diverse, task-agnostic datasets, modern machine learning models can solve specific downstream tasks either zero-shot or with small task-specific datasets to a high level of performance. While this capability has been demonstrated in other fields such as computer vision, natural language processing or speech recognition, it remains to be shown in robotics, where the generalization capabilities of the models are particularly critical due to the difficulty of collecting real-world robotic data. We argue that one of the keys to the success of such general robotic models lies with open-ended task-agnostic training, combined with high-capacity architectures that can absorb all of the diverse, robotic data. In this paper, we present a model class, dubbed Robotics Transformer, that exhibits promising scalable model properties. We verify our conclusions in a study of different model classes and their ability to generalize as a function of the data size, model size, and data diversity based on a large-scale data collection on real robots performing real-world tasks. The project's website and videos can be found at robotics-transformer.github.io

translated by 谷歌翻译

1st Workshop on Maritime Computer Vision (MaCVi) 2023: Challenge Results

Benjamin Kiefer , Matej Kristan , Janez Perš , Lojze Žust , Fabio Poiesi , Fabio Augusto de Alcantara Andrade , Alexandre Bernardino , Matthew Dawkins , Jenni Raitoharju , Yitong Quan

分类：计算机视觉 | 人工智能 | 机器学习 | 机器人

2022-11-24

The 1$^{\text{st}}$ Workshop on Maritime Computer Vision (MaCVi) 2023 focused on maritime computer vision for Unmanned Aerial Vehicles (UAV) and Unmanned Surface Vehicle (USV), and organized several subchallenges in this domain: (i) UAV-based Maritime Object Detection, (ii) UAV-based Maritime Object Tracking, (iii) USV-based Maritime Obstacle Segmentation and (iv) USV-based Maritime Obstacle Detection. The subchallenges were based on the SeaDronesSee and MODS benchmarks. This report summarizes the main findings of the individual subchallenges and introduces a new benchmark, called SeaDronesSee Object Detection v2, which extends the previous benchmark by including more classes and footage. We provide statistical and qualitative analyses, and assess trends in the best-performing methodologies of over 130 submissions. The methods are summarized in the appendix. The datasets, evaluation code and the leaderboard are publicly available at https://seadronessee.cs.uni-tuebingen.de/macvi.

translated by 谷歌翻译

CryptoGCN: Fast and Scalable Homomorphically Encrypted Graph Convolutional Network Inference

Ran Ran , Nuo Xu , Wei Wang , Quan Gang , Jieming Yin , Wujie Wen

分类：人工智能 | 机器学习

2022-09-24

最近，基于云的图形卷积网络（GCN）在许多对隐私敏感的应用程序（例如个人医疗保健和金融系统）中表现出了巨大的成功和潜力。尽管在云上具有很高的推理准确性和性能，但在GCN推理中保持数据隐私，这对于这些实际应用至关重要，但仍未得到探索。在本文中，我们对此进行了初步尝试，并开发了$ \ textit {cryptogcn} $ - 基于GCN推理框架的同型加密（HE）。我们方法成功的关键是减少HE操作的巨大计算开销，这可能比明文空间中的同行高的数量级。为此，我们开发了一种方法，可以有效利用GCN推断中基质操作的稀疏性，从而大大减少计算开销。具体而言，我们提出了一种新型的AMA数据格式方法和相关的空间卷积方法，该方法可以利用复杂的图结构并在HE计算中执行有效的矩阵矩阵乘法，从而大大减少HE操作。我们还开发了一个合作式框架，该框架可以通过明智的修剪和GCN中激活模块的多项式近似来探索准确性，安全级别和计算开销之间的交易折扣。基于NTU-Xview骨架关节数据集，即，据我们所知，最大的数据集对同型的评估，我们的实验结果表明，$ \ textit {cryptogcn} $均优胜于最先进的解决方案。同构操作的延迟和数量，即在延迟上达到3.10 $ \ times $加速，并将总代态操作数量减少77.4 \％，而准确度的较小精度损失为1-1.5 $ \％$。

translated by 谷歌翻译

Seen to Unseen: When Fuzzy Inference System Predicts IoT Device Positioning Labels That Had Not Appeared in Training Phase

Han Xu , Zheming Zuo , Jie Li , Victor Chang

分类：机器学习

2022-09-21

在人工智能（AI），机器学习（ML）以及更具体地说，深度学习（DL）的核心已经取得了巨大的成功。但是，由于缺少培训ML或DL模型中缺少类是看不见的，看不见的类标签预测的探索程度要小得多。在这项工作中，我们提出了一个模糊的推理系统，通过与基于曲率的特征选择（CFS）方法结合使用TSK+模糊推理引擎来应对这一挑战。通过预测物联网（IoT）领域内的网络设备的定位标签，已经评估了我们系统的实际可行性。竞争性预测性能证实了我们系统的效率和功效，尤其是在模型训练阶段看不见的大量连续类标签时。

translated by 谷歌翻译

Multi-agent Deep Reinforcement Learning for Charge-sustaining Control of Multi-mode Hybrid Vehicles

Min Hua , Quan Zhou , Cetengfei Zhang , Hongming Xu , Wei Liu

分类：机器学习

2022-09-06

运输电气化需要越来越多的电动机（例如电动机和电动机存储系统）上的电动机，并且对电动电气的控制通常涉及多个输入和多个输出（MIMO）。本文重点介绍了基于多代理增强学习（MARL）算法的多模式混合动力汽车的能源管理策略的在线优化，该算法旨在解决MIMO控制优化，而大多数现有方法仅处理单个输出控制。基于对基于深层确定性策略梯度（DDPG）基于的MARL算法优化的多模式混合动力汽车（HEV）的能源效率的分析，提出了一种新的与多代理的合作网络物理学习。然后，通过一种新颖的随机方法来设定学习驾驶周期，以加快训练过程。最终，网络设计，学习率和政策噪声被纳入了敏感性分析中，并确定了基于DDPG的算法参数，并研究了与多代理的不同关系的学习绩效，并证明与与不完全独立的关系比率0.2是最好的。与单一代理和多代理的同情研究表明，多代理可以在单一代理方案中获得总能量的4％提高。因此，MAL的多目标控制可以实现良好的优化效果和应用效率。

translated by 谷歌翻译

Compound Figure Separation of Biomedical Images: Mining Large Datasets for Self-supervised Learning

Tianyuan Yao , Chang Qu , Jun Long , Quan Liu , Ruining Deng , Yuanhan Tian , Jiachen Xu , Aadarsh Jha , Zuhayr Asad , Shunxing Bao

分类：计算机视觉

2022-08-30

随着自我监督学习的快速发展（例如，对比度学习），在医学图像分析中广泛认识到具有大规模图像（即使没有注释）来训练更具概括的AI模型的重要性。但是，大规模收集大规模任务的未注释数据对于单个实验室来说可能具有挑战性。现有的在线资源（例如数字书籍，出版物和搜索引擎）为获取大型图像提供了新的资源。然而，在医疗保健中发布的图像（例如放射学和病理学）由大量的带有子图的复合图组成。为了提取和分离化合物形象为下游学习的可用单个图像，我们提出了一个简单的复合图分离（SIMCFS）框架，而无需使用传统所需的检测边界框注释，并具有新的损失函数和硬案例模拟。我们的技术贡献是四倍：（1）我们引入了一个基于模拟的培训框架，该框架最小化了对资源广泛的边界框注释的需求；（2）我们提出了一种新的侧损失，可针对复合人物分离进行优化；（3）我们提出了一种阶层内图像增强方法来模拟硬病例；（4）据我们所知，这是第一项评估利用复合图像分离的自我监督学习功效的研究。从结果来看，提出的SIMCF在ImageClef 2016复合人物分离数据库上实现了最先进的性能。使用大规模开采数字的预审预革的学习模型通过对比度学习算法提高了下游图像分类任务的准确性。 SIMCF的源代码可在https://github.com/hrlblab/imageseperation上公开获得。

translated by 谷歌翻译

HTML版本

Structure-aware Editable Morphable Model for 3D Facial Detail Animation and Manipulation

Jingwang Ling , Zhibo Wang , Ming Lu , Quan Wang , Chen Qian , Feng Xu

分类：计算机视觉

2022-07-19

可变形的模型对于3D面的统计建模至关重要。以前的可变形模型的作品主要集中在大规模的面部几何形状上，但忽略了面部细节。本文通过学习一种结构含义的可编辑形态模型（SEMM）来增强形象模型。 SEMM基于皱纹线的距离字段引入了细节结构表示，并以细节位移进行建模，以建立更好的对应关系并实现对皱纹结构的直观操纵。此外，SEMM还引入了两个转换模块，以将表达式的融合体权重和年龄值转化为潜在空间的变化，从而在维持身份的同时可以有效的语义细节编辑。广泛的实验表明，所提出的模型紧凑地表示面部细节，在定性和定量上表达动画中的先前方法，并实现了面部细节的有效年龄编辑和皱纹线编辑。代码和模型可在https://github.com/gerwang/facial-detail-manipulation上找到。

translated by 谷歌翻译

Unsupervised Capsule Networks of High-Dimension Point Clouds classification

Quanfeng Xu , Yi Tang , Yan Yang , Yumei She , Zuo Jiang

分类：计算机视觉 | 人工智能

2022-06-15

在不规则的几何结构和高维空间的情况下，三维点云学习被广泛应用，但是点云仍无法令人满意地处理分类和识别任务。在3D空间中，点云由于其密度而倾向于具有规则的欧几里得结构。相反，由于高维度，高维空间的空间结构更为复杂，而点云主要在非欧洲结构中呈现。此外，在当前的3D点云分类算法中，基于欧几里得距离的规范胶囊算法很难有效分解并有效地识别非欧几里得结构。因此，针对3D和高维空间中非欧国人结构的点云分类任务时，本文是指基于测量距离的LLE算法，以优化并提出了高维点云的无监督算法。在本文中，在提取过程中考虑了点云的几何特征，以便将高维的非欧几里得结构转变为具有保持空间几何特征的较低维度的欧几里得结构。为了验证高维点云胶囊的无监督算法的可行性，在瑞士滚动数据集，点云MNIST数据集和点云LFW数据集中进行了实验。结果表明，（1）可以在瑞士滚动数据集中有效地确定（1）非欧几里得结构；（2）在Point Clouds MNIST数据集中实现了重要的无监督学习效果。总之，本文提出的高维点云无监督算法有利于扩展当前点云分类和识别任务的应用程序方案。

translated by 谷歌翻译

Semi-Supervised Contrastive Learning for Remote Sensing: Identifying Ancient Urbanization in the South Central Andes

Jiachen Xu , James Zimmer-Dauphinee , Quan Liu , Yuxuan Shi , Steven Wernke , Yuankai Huo

分类：计算机视觉 | 机器学习

2021-12-13

古代定居点的检测是景观考古学的关键。传统上，通过行人调查确定了定居点，因为研究人员在物理上穿过景观和记录的结算位置。最近，古老遗骸的手动识别和标签在卫星图像上增加了考古数据收集的规模，但该过程仍然耗时耗时和艰巨。自我监督学习的发展（例如，对比学习）在使用未标记的卫星和历史空中图像定位考古地点提供可扩展的学习方案。然而，考古站点仅以整个景观的一部分出现，而现代对比监督的学习方法通常会在高度平衡的数据集中产生较差的性能，例如使用卫星图像在大面积上识别稀疏局部古城区化。在这项工作中，我们提出了一个解决这个长尾问题的框架。与通常分别处理标记和未标记数据的现有对比学习方法相反，所提出的方法在半监督环境下改革学习范例，以充分利用宝贵的注释数据（我们的设置中<7％）。具体地，通过在未unnotated图像斑块之间的相似性和注释的锚图像之间的相似性来形成数据的高度不平衡性质，以形成伪负对的先验知识。在这项研究中，我们使用了95,358个未标记的图像和5,830个标记的图像来解决从长尾卫星图像数据集检测古建筑的问题。从结果中，我们的半监督对比学习模式实现了79.0％的有前途的测试均衡准确性，而最先进的方法的改善是3.8％。

translated by 谷歌翻译